Ajuste de instrucción visual alinea modalidades por abstracción Descubre cómo el ajuste visual alinea imágenes y texto en modelos de lenguaje, optimizando el rendimiento multimodal sin aumentar el tiempo de entrenamiento. 2026-06-03 · 2 min